Národní úložiště šedé literatury Nalezeno 8 záznamů.  Hledání trvalo 0.00 vteřin. 
Systém pro doporučování filmů
Janko, Pavel ; Zbořil, František (oponent) ; Šůstek, Martin (vedoucí práce)
Tato práce se zabývá především přístupy k sestrojení systému pro doporučování filmů. Je zde obecně popsán princip neuronových sítí a rovněž jsou zde shrnuty základní i pokročilé techniky pro tvorbu doporučovacích systémů. Jádrem práce je návrh, implementace a experimentování se systémem, jehož cílem je doporučování filmů na základě dat pocházejících z volně dostupných datových sad. Pro předpovědi hodnocení, které by uživatel udělil filmům po jejich shlédnutí, systém využívá faktorizační model založený na kolaborativním filtrování. Práce dále řeší souvislosti konfigurace hyperparametrů modelu s přesností doporučení, provádění experimentů za účelem zlepšení přesnosti modelu a nakonec srovnání modelu s existujícími řešeními.
Zvyšování konzistence v datových sadách pro rozpoznávání textu
Tvarožný, Matúš ; Hradiš, Michal (oponent) ; Kišš, Martin (vedoucí práce)
Táto práca sa zaoberá zvyšovaním konzistencie dátových sád pre rozpoznávanie textu. V tejto práci sú popísane problémy, ktoré nekonzistenciu spôsobujú a následne sú predstavené riešenia na jej odstránenie. Skúmaný je vplyv vlastností polygónov definujúcich ohraničenie riadkov a teda to ako upravená verzia dátovej sady, ktorá je zložená z ideálnych variant riadkov ovplyvnila presnosť modelu. Ďalej sa práca zameriava na detekciu a následné odstránenie alebo upravenie riadkov, ktorých prepis ground truth nekorešponduje so skutočným textom, ktorý sa na nich nachádza. Experimentovaním sa ukázalo, že odstránenie vizuálnej nekonzistencie na trénovacej sade nemá zásadný vplyv na natrénovanosť modelu, za to poupravením testovacej sady sa presnosť OCR modelu zlepšila o 1.1\% CER. Upravením dátovej sady tak, aby neobsahovala navzájom nekonzistentné dvojice rozpoznávaného textu a príslušnej ground truth, sa model po opätovnom natrénovaní zlepšil maximálne len o 0.2\% CER. Hlavným zistením tejto práce je predovšetkým preukázaný priaznivý účinok odstránenia nekonzistencie na testovacích sadách, vďaka ktorému je možné zistiť reálnejšiu chybovosť OCR modelu.
Analýza dat síťové komunikace mobilních zařízení
Abraham, Lukáš ; Bartík, Vladimír (oponent) ; Burgetová, Ivana (vedoucí práce)
Práce na svém začátku popisuje protokoly DNS a SSL/TLS, věnuje se hlavně komunikaci mezi zařízeními pomocí těchto protokolů. Poté si povíme něco o předzpracování dat a jejich čištění. Dále se práce zaobírá základními technikami pro dolování dat, jako jsou klasifikace dat, asociační analýza, vyhledávání dokumentů, regresní analýza a shluková analýza. V další kapitole si můžeme přečíst něco o tom, jak se dají identifikovat mobilní zařízení v síti. Zhodnotíme datové sady, které obsahují nasbíraná data z komunikace mezi protokoly DNS a SSL/TLS se kterými se bude pracovat v praktické části. Po té se konečně dostaneme k návrhu systému pro analýzu dat síťové komunikace. Popíšeme si použité knihovny a celou implementaci systému. Provedeme velké množství experimentů, které na konec ohodnotíme.
Datové sady pro síťovou bezpečnost
Setinský, Jiří ; Hranický, Radek (oponent) ; Tisovčík, Peter (vedoucí práce)
V oblasti síťové bezpečnosti se používají techniky strojového učení pro efektivní detekci anomálií a malwaru v síťovém provozu. Pro natrénování síťového klasifikátoru s vysokou úspěšností je potřeba kvalitní datová sada. Cílem práce je modifikace datové sady pomocí metod strojového učení za účelem zlepšení kvality datové sady, která povede na natrénování modelu s vyšší úspěšností. Datová sada je zanalyzována shlukovacím algoritmem a každý shluk je charakterizován statistickým popisem vyplývající z atributů vstupní datové sady. Statistický popis spolu s informacemi o původním klasifikátoru je použit pro výpočet skóre. Skóre slouží jako váha při modifikační fázi. Shluková analýza umožní vyfiltrovat data, která jsou důležitá pro natrénování výsledného modelu. Navržený přístup umožňuje zmírnit redundanci datové sady a nebo ji rozšířit o chybějící data. Výsledkem je modifikační framework, který je schopen redukovat datové sady nebo provádět jejich agregaci za účelem vytvoření kompaktní datové sady, která bude reflektovat aktuální síťový provoz. Na vytvořených datových sadách se podařilo natrénovat modely dosahující vyšší úspěšnosti v porovnání s existujícím řešením.
Model of Cycling Traffic Intensity in Brno
Eliáš, Radoslav ; Burget, Radek (oponent) ; Hynek, Jiří (vedoucí práce)
The Brno Data Department has access to multiple datasets regarding cycling traffic numbers. The goal of the thesis was developing a model integrating these sources for the Transportation Department of the city planning office to gain insights about how the infrastructure is used daily. Each dataset is aggregated to a different basemap with a slightly different street network. This thesis introduces an algorithmic approach to street matching based on similarity, overlap percentage and other parameters. Two algorithms for matching point-based and polyline-based geometries are presented. As well as a model mapping locations among different datasets and a dashboard visualizing values from them side-by-side. The robustness of the algorithms enables usage in any geographical application using spatial data. The dashboard provides useful information about cycling transport for both casual users and professionals designing the infrastructure of Brno.
Zvyšování konzistence v datových sadách pro rozpoznávání textu
Tvarožný, Matúš ; Hradiš, Michal (oponent) ; Kišš, Martin (vedoucí práce)
Táto práca sa zaoberá zvyšovaním konzistencie dátových sád pre rozpoznávanie textu. V tejto práci sú popísane problémy, ktoré nekonzistenciu spôsobujú a následne sú predstavené riešenia na jej odstránenie. Skúmaný je vplyv vlastností polygónov definujúcich ohraničenie riadkov a teda to ako upravená verzia dátovej sady, ktorá je zložená z ideálnych variant riadkov ovplyvnila presnosť modelu. Ďalej sa práca zameriava na detekciu a následné odstránenie alebo upravenie riadkov, ktorých prepis ground truth nekorešponduje so skutočným textom, ktorý sa na nich nachádza. Experimentovaním sa ukázalo, že odstránenie vizuálnej nekonzistencie na trénovacej sade nemá zásadný vplyv na natrénovanosť modelu, za to poupravením testovacej sady sa presnosť OCR modelu zlepšila o 1.1\% CER. Upravením dátovej sady tak, aby neobsahovala navzájom nekonzistentné dvojice rozpoznávaného textu a príslušnej ground truth, sa model po opätovnom natrénovaní zlepšil maximálne len o 0.2\% CER. Hlavným zistením tejto práce je predovšetkým preukázaný priaznivý účinok odstránenia nekonzistencie na testovacích sadách, vďaka ktorému je možné zistiť reálnejšiu chybovosť OCR modelu.
Systém pro doporučování filmů
Janko, Pavel ; Zbořil, František (oponent) ; Šůstek, Martin (vedoucí práce)
Tato práce se zabývá především přístupy k sestrojení systému pro doporučování filmů. Je zde obecně popsán princip neuronových sítí a rovněž jsou zde shrnuty základní i pokročilé techniky pro tvorbu doporučovacích systémů. Jádrem práce je návrh, implementace a experimentování se systémem, jehož cílem je doporučování filmů na základě dat pocházejících z volně dostupných datových sad. Pro předpovědi hodnocení, které by uživatel udělil filmům po jejich shlédnutí, systém využívá faktorizační model založený na kolaborativním filtrování. Práce dále řeší souvislosti konfigurace hyperparametrů modelu s přesností doporučení, provádění experimentů za účelem zlepšení přesnosti modelu a nakonec srovnání modelu s existujícími řešeními.
Analýza dat síťové komunikace mobilních zařízení
Abraham, Lukáš ; Bartík, Vladimír (oponent) ; Burgetová, Ivana (vedoucí práce)
Práce na svém začátku popisuje protokoly DNS a SSL/TLS, věnuje se hlavně komunikaci mezi zařízeními pomocí těchto protokolů. Poté si povíme něco o předzpracování dat a jejich čištění. Dále se práce zaobírá základními technikami pro dolování dat, jako jsou klasifikace dat, asociační analýza, vyhledávání dokumentů, regresní analýza a shluková analýza. V další kapitole si můžeme přečíst něco o tom, jak se dají identifikovat mobilní zařízení v síti. Zhodnotíme datové sady, které obsahují nasbíraná data z komunikace mezi protokoly DNS a SSL/TLS se kterými se bude pracovat v praktické části. Po té se konečně dostaneme k návrhu systému pro analýzu dat síťové komunikace. Popíšeme si použité knihovny a celou implementaci systému. Provedeme velké množství experimentů, které na konec ohodnotíme.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.